This paper brings together two lines of research: factor-based models of case-based reasoning (CBR) and the logical specification of classifiers. Logical approaches to classifiers capture the connection between features and outcomes in classifier systems. Factor-based reasoning is a popular approach to reasoning by precedent in AI & Law. Horty (2011) has developed the factor-based models of precedent into a theory of precedential constraint. In this paper we combine the modal logic approach (binary-input classifier, BLC) to classifiers and their explanations given by Liu & Lorini (2021) with Horty's account of factor-based CBR, since both a classifier and CBR map sets of features to decisions or classifications. We reformulate case bases of Horty in the language of BCL, and give several representation results. Furthermore, we show how notions of CBR, e.g. reason, preference between reasons, can be analyzed by notions of classifier system.
translated by 谷歌翻译
近年来,人们对布尔功能的重新兴趣在解释可解释的AI(XAI)领域的二元分类器方面产生了兴趣。布尔函数的标准方法是命题逻辑。我们提出了一种ceteris paribus性质的模态语言,该语言支持有关二进制输入分类器及其属性的推理。我们研究一个分类器模型家庭,将其作为有关语言基础性的两个证明系统,并显示出我们的Axiomatics的完整性。此外,我们证明,我们模态语言的可满足性检查问题在无限变化的情况下是nexptime-complete,而在有限变量的情况下它变为多项式。在无限变化的情况下,我们还确定了我们语言的有趣的NP片段。我们利用语言来形式化反事实的条件以及各种解释概念,包括绑架,对比和反事实解释以及偏见。最后,我们介绍了我们的语言的两个扩展:通过分配的概念使分类器变化和认知扩展,可以表示分类器对实际输入的不确定性。
translated by 谷歌翻译
聊天机器人用于许多应用程序中,例如自动化代理,智能家庭助理,在线游戏中的互动角色等。因此,确保他们不会以不希望的方式行事,对用户提供令人反感或有毒的反应。这并不是一项琐碎的任务,因为最先进的聊天机器人模型是在从互联网公开收集的大型公共数据集上培训的。本文提出了对聊天机器人中毒性的首次大规模测量。我们表明,公开可用的聊天机器人很容易在喂养有毒的查询时提供有毒的反应。更令人担忧的是,一些无毒的查询也会触发有毒反应。然后,我们着手设计和实验攻击,即毒性,该攻击依赖于微调的GPT-2来产生无毒的查询,使聊天机器人以有毒的方式做出反应。我们广泛的实验评估表明,我们的攻击对公共聊天机器人模型有效,并且优于先前工作提出的手动制作的恶意查询。我们还评估了针对毒性的三种防御机制,表明它们要么以影响聊天机器人的效用而降低攻击性能,要么仅有效地减轻了一部分攻击。这强调了对计算机安全和在线安全社区进行更多研究的需求,以确保聊天机器人模型不会伤害其用户。总体而言,我们有信心有毒可以用作审计工具,我们的工作将为设计更有效的聊天机器人安全防御措施铺平道路。
translated by 谷歌翻译
对网络攻击的现代防御越来越依赖于主动的方法,例如,基于过去的事件来预测对手的下一个行动。建立准确的预测模型需要许多组织的知识; las,这需要披露敏感信息,例如网络结构,安全姿势和政策,这些信息通常是不受欢迎的或完全不可能的。在本文中,我们探讨了使用联合学习(FL)预测未来安全事件的可行性。为此,我们介绍了Cerberus,这是一个系统,可以为参与组织的复发神经网络(RNN)模型进行协作培训。直觉是,FL可能会在非私有方法之间提供中间地面,在非私有方法中,训练数据在中央服务器上合并,而仅训练本地模型的较低性替代方案。我们将Cerberus实例化在从一家大型安全公司的入侵预防产品中获得的数据集上,并评估其有关实用程序,鲁棒性和隐私性,以及参与者如何从系统中贡献和受益。总体而言,我们的工作阐明了将FL执行此任务的积极方面和挑战,并为部署联合方法以进行预测安全铺平了道路。
translated by 谷歌翻译
我们在基于分子的机器学习(MOB-ML)中介绍了一种新颖的机器学习策略,即内核加法过程回归(KA-GPR),以了解封闭式和开放式壳的通用电子结构理论的总相关能力通过引入机器学习策略来系统。 MOB-ML(KA-GPR)的学习效率与最小的Criegee分子的原始MOB-ML方法相同,这是具有多引用特征的封闭壳分子。此外,通过示例结构训练,不同小自由基的预测精度可以达到1 kcal/mol的化学精度。 MOB-ML(KA-GPR)也可以生成H10链(闭合壳)和水OH OH离解(开放壳)的准确势能表面。为了探索KA-GPR可以描述的化学系统的广度,我们进一步应用MOB-ML准确预测闭合的大型基准数据集,用于闭合 - (QM7B-T,GDB-13-T)和Open-Shell(QMSPIN)分子。
translated by 谷歌翻译
与脑电图(TMS-EEG)共同注册的经颅磁刺激先前已证明是对阿尔茨海默氏病(AD)研究的有用工具。在这项工作中,我们研究了使用TMS诱发的脑电图反应的使用,以对健康对照(HC)分类AD患者。通过使用包含17AD和17HC的数据集,我们从单个TMS响应中提取各种时域特征,并在低,中和高密度EEG电极集中平均它们。在保留一项受试者的验证方案中,使用带有随机森林分类器的高密度电极获得了AD与HC的最佳分类性能。准确性,灵敏度和特异性分别为92.7%,96.58%和88.2%。
translated by 谷歌翻译
本文重点介绍了静态和时变设置中决策依赖性分布的随机鞍点问题。这些是目标是随机收益函数的预期值,其中随机变量从分布图引起的分布中绘制。对于一般分布地图,即使已知分布是已知的,发现鞍点的问题也是一般的计算繁琐。为了实现易求解的解决方案方法,我们介绍了均衡点的概念 - 这是它们诱导的静止随机最小值问题的马鞍点 - 并为其存在和唯一性提供条件。我们证明,两个类解决方案之间的距离被界定,条件是该目标具有强凸强 - 凹入的收益和Lipschitz连续分布图。我们开发确定性和随机的原始算法,并证明它们对均衡点的收敛性。特别是,通过将来自随机梯度估计器的出现的错误建模为子-Weibull随机变量,我们提供期望的错误界限,并且在每个迭代的高概率中提供的误差;此外,我们向期望和几乎肯定地显示给社区的融合。最后,我们调查了分布地图的条件 - 我们调用相反的混合优势 - 确保目标是强烈的凸强 - 凹陷的。在这种假设下,我们表明原始双算法以类似的方式汇集到鞍座点。
translated by 谷歌翻译
分类预测建模涉及准确地分配数据集中的观察到目标类或类别。具有严重不平衡的类分布的现实世界分类问题的增长越来越大。在这种情况下,少数群体的观察比较少于多数阶级的观察。尽管这种稀疏性,但少数民族阶级通常被认为是更有趣的阶级,但制定适合观察的科学学习算法呈现无数挑战。在本文中,我们建议一种专门用于根据我们称为Samme.c2的方法处理严重不平衡类的新型多级分类算法。它与SAMME算法,多级分类器和ADA.C2算法中的升压技术的灵活机制混合,这是一种成本敏感的二进制分类器,旨在解决高度类别的不平衡。我们不仅提供了所得算法,但我们还建立了我们提出的Samme.c2算法的科学和统计制定。通过数值实验检查各种程度的分类器难度,我们展示了我们所提出的模型的一致优越性。
translated by 谷歌翻译
现代机器学习算法能够提供非常精确的点预测的;然而,问题仍然是其统计的可靠性。不同于传统的机器学习方法,适形的预测算法返回置信集(即,集值的预测),其对应于给定的显着水平。此外,这些置信集在这个意义上,它们保证有限样本控制1型误差的概率,从而允许医生选择在可接受的误差率有效。在本文中,我们提出了感应式保形预测(ICP)算法用于文本充填和部分的语音(POS)预测自然语言数据的任务。我们从变压器(BERT)和词性标注和文字充填新形预测增强BERT算法双向长短期记忆(BiLSTM)算法构建新的适形预测增强的双向编码表示。我们分析的算法采用Brown语料库,其中包含超过57000句模拟性能。我们的研究结果表明,ICP算法能够产生有效的集值预测是小到足以适用于现实世界的应用。我们也为我们提出了集值预测如何提高机器生成的音频转录一个真实数据的例子。
translated by 谷歌翻译
短片已成为年轻一代使用的领先媒体之一,以便在线表达自己,从而塑造在线文化中的驱动力。在这方面,Tiktok已成为往往首先发布病毒视频的平台。在本文中,我们研究了在Tiktok上发布的短片内容有助于他们的病毒。我们应用一种混合方法方法来开发码本并识别重要的病毒功能。我们这样做是如此vis- \'a-vis三个研究假设;即:1)视频内容,2)Tiktok的推荐算法,以及3)视频创建者的普及有助于病毒性。我们收集并标记400个Tiktok视频和火车分类器的数据集,以帮助我们确定最多影响景象的功能。虽然追随者的数量是最强大的预测因子,但特写和中射尺度也起到重要作用。因此视频的寿命,文本的存在以及观点。我们的研究突出了与非病毒Tiktok视频区分病毒的特征,奠定了制定额外方法来创建更多聘用的在线内容,并主动地确定可能达到大量受众的风险内容。
translated by 谷歌翻译